智能论文笔记

Federated Meta-Learning for Traffic Steering in O-RAN

Hakan Erdol , Xiaoyang Wang , Peizheng Li , Jonathan D. Thomas , Robert Piechocki , George Oikonomou , Rui Inacio , Abdelrahim Ahmad , Keith Briggs , Shipra Kapoor

分类：机器学习

2022-09-13

与LTE网络相比，5G的愿景在于提供较高的数据速率，低延迟（为了实现近实时应用程序），大大增加了基站容量以及用户的接近完美服务质量（QoS）。为了提供此类服务，5G系统将支持LTE，NR，NR-U和Wi-Fi等访问技术的各种组合。每种无线电访问技术（RAT）都提供不同类型的访问，这些访问应在用户中对其进行最佳分配和管理。除了资源管理外，5G系统还将支持双重连接服务。因此，网络的编排对于系统经理在旧式访问技术方面来说是一个更困难的问题。在本文中，我们提出了一种基于联合元学习（FML）的大鼠分配算法，该算法使RAN Intelligent Controller（RIC）能够更快地适应动态变化的环境。我们设计了一个包含LTE和5G NR服务技术的模拟环境。在模拟中，我们的目标是在传输的截止日期内满足UE需求，以提供更高的QoS值。我们将提出的算法与单个RL试剂，爬行动物算法和基于规则的启发式方法进行了比较。仿真结果表明，提出的FML方法分别在第一部部署回合21％和12％时达到了较高的缓存率。此外，在比较方法中，提出的方法最快地适应了新任务和环境。

translated by 谷歌翻译

Variational Autoencoder Assisted Neural Network Likelihood RSRP Prediction Model

Peizheng Li , Xiaoyang Wang , Robert Piechocki , Shipra Kapoor , Angela Doufexi , Arjun Parekh

分类：机器学习

2022-06-27

衡量移动数据的客户体验对于全球移动运营商来说至关重要。收到的参考信号（RSRP）是当前移动网络管理，评估和监视的重要指标之一。通过最小化驱动器测试（MDT）（一种3GPP标准技术）收集的无线电数据通常用于无线网络分析。在不同地理区域收集MDT数据效率低下，受地形条件和用户的存在限制，因此对于动态无线电环境来说不是足够的技术。在本文中，我们研究了RSRP预测，利用MDT数据和数字双胞胎（DT）的生成模型，并提出了数据驱动的两层神经网络（NN）模型。在第一层中，与用户设备（UE）相关的环境信息，基站（BS）和网络关键性能指标（KPI）是通过变量自动编码器（VAE）提取的。第二层被设计为可能性模型。在这里，采用了环境功能和实际MDT数据功能，制定了集成的培训过程。在验证中，我们提出的使用现实世界数据的模型表明，与经验模型相比，与完全连接的预测网络相比，与经验模型相比，精度提高了约20％或更多。

translated by 谷歌翻译

Sim2real for Reinforcement Learning Driven Next Generation Networks

Peizheng Li , Jonathan Thomas , Xiaoyang Wang , Hakan Erdol , Abdelrahim Ahmad , Rui Inacio , Shipra Kapoor , Arjun Parekh , Angela Doufexi , Arman Shojaeifard

分类：机器学习

2022-06-08

下一代网络将积极采用人工智能（AI）和机器学习（ML）技术，用于自动化网络和最佳网络操作策略。以Open Ran（O-Ran）为代表的新兴网络结构符合这一趋势，其规范中心的无线电智能控制器（RIC）用作ML应用程序主机。各种ML模型，尤其是强化学习（RL）模型，被认为是解决与RAN相关的多目标优化问题的关键。但是，应该认识到，当前大多数RL成功都局限于抽象和简化的仿真环境，这可能不会直接转化为复杂的真实环境中的高性能。主要原因之一是模拟与真实环境之间的建模差距，这可能会使RL代理通过模拟训练不适合真实环境。此问题称为SIM2REAL差距。本文在O-Ran的背景下引起了SIM2REAL挑战。具体而言，它强调了数字双胞胎（DT）可以作为模型开发和验证的地方的特征和好处。提出了几种用例，以举例说明并证明在真实环境中训练有训练的RL模型的故障模式。讨论了DT在协助RL算法开发方面的有效性。然后提出了通常用于克服SIM2REAL挑战的基于学习的基于艺术学习的方法。最后，从数据交互，环境瓶颈和算法设计等潜在问题的角度讨论了O-RAN中RL应用程序实现的开发和部署问题。

translated by 谷歌翻译

RLOps: Development Life-cycle of Reinforcement Learning Aided Open RAN

Peizheng Li , Jonathan Thomas , Xiaoyang Wang , Ahmed Khalil , Abdelrahim Ahmad , Rui Inacio , Shipra Kapoor , Arjun Parekh , Angela Doufexi , Arman Shojaeifard

分类：机器学习

2021-11-12

无线电接入网络（RAN）技术继续见证巨大的增长，开放式运行越来越最近的势头。在O-RAN规范中，RAN智能控制器（RIC）用作自动化主机。本文介绍了对O-RAN堆栈相关的机器学习（ML）的原则，特别是加强学习（RL）。此外，我们审查无线网络的最先进的研究，并将其投入到RAN框架和O-RAN架构的层次结构上。我们在整个开发生命周期中提供ML / RL模型面临的挑战的分类：从系统规范到生产部署（数据采集，模型设计，测试和管理等）。为了解决挑战，我们将一组现有的MLOPS原理整合，当考虑RL代理时，具有独特的特性。本文讨论了系统的生命周期模型开发，测试和验证管道，称为：RLOPS。我们讨论了RLOP的所有基本部分，包括：模型规范，开发和蒸馏，生产环境服务，运营监控，安全/安全和数据工程平台。根据这些原则，我们提出了最佳实践，以实现自动化和可重复的模型开发过程。

translated by 谷歌翻译

Follow The Rules: Online Signal Temporal Logic Tree Search for Guided Imitation Learning in Stochastic Domains

Jasmine Jerry Aloor , Jay Patrikar , Parv Kapoor , Jean Oh , Sebastian Scherer

分类：机器人

2022-09-27

将规则无缝整合到学习中（LFD）策略是启用AI代理的现实部署的关键要求。最近，信号时间逻辑（STL）已被证明是将规则作为时空约束的有效语言。这项工作使用蒙特卡洛树搜索（MCT）作为将STL规范集成到香草LFD策略中以提高约束满意度的一种手段。我们建议以STL鲁棒性值来增强MCT启发式，以使树的搜索偏向具有更高限制满意度的分支。虽然无域的方法可以应用于将STL规则在线整合到任何预训练的LFD算法中，但我们选择目标条件的生成对抗性模仿学习作为离线LFD策略。我们将提出的方法应用于规划轨迹的领域，用于在非较低机场周围的通用航空飞机。使用对现实世界数据进行训练的模拟器的结果显示了60％的性能比不使用STL启发式方法的基线LFD方法提高了性能。

translated by 谷歌翻译

Online Allocation and Learning in the Presence of Strategic Agents

Steven Yin , Shipra Agrawal , Assaf Zeevi

分类：机器学习

2022-09-25

我们研究了在$ n $均质代理之间分配$ t $依次到达项目的问题，即每个代理必须收到所有项目的预先指定的分数，目的是最大化代理商的总估值，分配给他们的项目的总估值。假定代理在每轮中对该项目的估值为I.I.D。但是它们的分布是中央计划者未知的先验。因此，中央规划师需要从观察到的价值中隐含地学习这些分布，以便选择良好的分配策略。但是，这里的另一个挑战是，代理商是战略性的，并激励他们误导其估值，以便获得更好的分配。这使我们的工作与在线拍卖设计设置不同，这些设置通常假设已知的估值分布和/或涉及付款，也可以从不考虑战略代理的在线学习环境中进行付款。为此，我们的主要贡献是一种基于在线学习的分配机制，大约是贝叶斯激励兼容的，当所有代理人都是真实的时，与最佳离线分配政策相比，在所有代理商的效用中保证了sublinear的遗憾。

translated by 谷歌翻译

Automated detection of Alzheimer disease using MRI images and deep neural networks- A review

Narotam Singh , Patteshwari. D , Neha Soni , Amita Kapoor

分类：计算机视觉 | 机器学习

2022-09-22

早期发现阿尔茨海默氏病对于部署干预措施和减慢疾病进展至关重要。在过去的十年中，已经探索了许多机器学习和深度学习算法，目的是为阿尔茨海默氏症建立自动检测。数据增强技术和先进的深度学习体系结构的进步已经在该领域开辟了新的边界，研究正在快速发展。因此，这项调查的目的是概述有关阿尔茨海默氏病诊断深度学习模型的最新研究。除了对众多数据源，神经网络架构以及常用的评估措施进行分类外，我们还对实施和可重复性进行了分类。我们的目标是协助感兴趣的研究人员跟上最新的发展，并将早期的调查作为基准。此外，我们还指出了该主题的未来研究方向。

translated by 谷歌翻译

PACT: Perception-Action Causal Transformer for Autoregressive Robotics Pre-Training

Rogerio Bonatti , Sai Vemprala , Shuang Ma , Felipe Frujeri , Shuhang Chen , Ashish Kapoor

分类：机器人 | 人工智能 | 计算机视觉 | 机器学习

2022-09-22

长期以来，Robotics一直是一个遍布复杂系统体系结构的领域，无论传统或基于学习的模块和联系都需要大量的人类专业知识和先验知识。受大型预训练语言模型的启发，这项工作引入了预先培训的通用表示范式，该范式可以作为给定机器人多个任务的起点。我们提出了感知性因果变压器（PACT），这是一种基于生成变压器的架构，旨在以自我监督的方式直接从机器人数据构建表示形式。通过对状态和行动的自动回归预测，我们的模型隐含地编码了特定机器人的动态和行为。我们的实验评估重点是移动药物的域，我们表明该机器人特定的表示可以作为单个起点，以实现不同的任务，例如安全导航，定位和映射。我们评估了两个形式：使用激光雷达传感器作为感知输入（MUSHR）的轮式机器人，以及使用第一人称RGB图像（栖息地）的模拟药物。我们表明，与训练单个模型的同时训练单个模型相比，对所有任务的单个模型进行训练，并且与独立培训单独的大型模型相当的性能，对每个任务的单个模型进行了可比的训练，则在较大的审计模型上进行了固定小型任务特异性网络，从而使性能明显提高。通过跨任务共享共同的优质表示，我们可以降低整体模型容量并加快此类系统的实时部署。

translated by 谷歌翻译

Learning to Simulate Realistic LiDARs

Benoit Guillard , Sai Vemprala , Jayesh K. Gupta , Ondrej Miksik , Vibhav Vineet , Pascal Fua , Ashish Kapoor

分类：机器人 | 计算机视觉

2022-09-22

模拟逼真的传感器是自主系统数据生成的挑战，通常涉及精心手工的传感器设计，场景属性和物理建模。为了减轻这一点，我们引入了一条管道，用于对逼真的激光雷达传感器进行数据驱动的模拟。我们提出了一个模型，该模型可以在RGB图像和相应的LIDAR功能（例如Raydrop或每点强度）之间直接从真实数据集中进行映射。我们表明，我们的模型可以学会编码逼真的效果，例如透明表面上的掉落点或反射材料上的高强度回报。当应用于现成的模拟器软件提供的天真播放点云时，我们的模型通过根据场景的外观预测强度和删除点来增强数据，以匹配真实的激光雷达传感器。我们使用我们的技术来学习两个不同的LIDAR传感器的模型，并使用它们相应地改善模拟的LiDAR数据。通过车辆细分的示例任务，我们表明通过我们的技术增强模拟点云可以改善下游任务性能。

translated by 谷歌翻译

Auto-TransRL: Autonomous Composition of Vision Pipelines for Robotic Perception

Aditya Kapoor , Nijil George , Vartika Sengar , Vighnesh Vatsal , Jayavardhana Gubbi

分类：计算机视觉 | 机器人

2022-09-07

为不同数据集创建视力管道来解决计算机视觉任务是一个复杂且耗时的过程。目前，这些管道是在域专家的帮助下开发的。此外，除了依靠经验，反复试验或使用基于模板的方法外，没有系统的结构来构建视觉管道。由于选择合适的算法来实现特定视觉任务的搜索空间是大型的人类探索，以找到良好的解决方案需要时间和精力。为了解决以下问题，我们提出了一种动态和数据驱动的方式，以确定一组适当的算法，该算法适合构建视觉管道以实现目标任务。我们介绍了一种辅助的变压器体系结构，并采用了深厚的强化学习，以推荐可以在视觉工作流的不同阶段合并的算法。该系统既强大又适应环境的动态变化。实验结果进一步表明，我们的方法还很好地推荐了训练时未使用的算法，因此减轻了在测试期间引入的新算法上对系统进行重新训练的需求。

translated by 谷歌翻译